iT邦幫忙

第 12 屆 iThome 鐵人賽

DAY 14
0
Software Development

在AI的時代追求人性系列 第 14

人機互動之推論統計簡介(3):常態分佈、t分佈與t檢定

  • 分享至 

  • xImage
  •  

上一篇提Z檢定的時候,
有提到他的前提有一條是必須要知道原本的母體的變異數/標準差,
或者是需要夠大的樣本數。
這件條件在很多時候並不能被滿足,因此就有我們今天要介紹的t檢定的產生啦~

t檢定顧名思義,是基於t分配來做的檢定。什麼是t分配呢?
要介紹t分配,我們還是回頭先介紹一下常態分配實際的長相:
https://ithelp.ithome.com.tw/upload/images/20200928/20130709UQ1S7ZyDK0.png
(圖片來源:https://commons.wikimedia.org/wiki/File:Standard_Normal_Distribution.png)

常態分配基本上就是在描述一個變數,他的平均值跟標準差會形成一個固定的分佈。
有68.3%的機率,該變數的數值會落在平均值正負一個標準差,
有95.4%的機率,該變數的數值會落在平均值正負兩個標準差,
有99.7%的機率,該變數的數值會落在平均值正負三個標準差。

在母體變異數/標準差未知的情況下,我們就只能用樣本的變異數/標準差估算他。
因此t分配就是把常態分佈加上與樣本數相關的「自由度(常寫作df或『ν』, nu)」,
這個自由度會影響分配的形狀,而當自由度越大,他就會越接近常態分佈
(可以想成樣本數越多,估出來的變異數/標準差就越接近真實值),
我們可以看到下圖畫出隨著自由度增加,一點一滴變得更加接近常態分佈,
當自由度無限大時,就是常態分佈。
https://ithelp.ithome.com.tw/upload/images/20200928/20130709CfpSWvRfpq.png
(圖片來源:https://commons.wikimedia.org/wiki/File:Student_t_pdf.svg)

而前一篇提到樣本數>30算是足夠大,也是因為t分配在自由度大概30的時候,
已經很接近常態分配,才會有這種經驗上的作法。

既然t分佈是Z分佈衍伸出來的,t檢定的本質也跟Z檢定一樣,
是去看一個變數跟一個值的差異,是否符合t分配在信賴區間會發生的情況,
不是的話就代表他們的差異是顯著的。

上面所說的其實是基本款的t檢定,
精確地來說這是「單一獨立樣本t檢定(One-sample t-Test)」。
而t檢定常用的還有「獨立樣本t檢定(Independent-sample t-Test)」跟
「成對樣本t檢定(Paired-sample t-Test)」。

單一獨立樣本的t檢定可以用在跟上篇一樣測身高的例子,
因為上篇那個例子實際上用t檢定會比用Z檢定更好
(因為我們不知道台灣人真實的身高變異數)。

而後面兩種t檢定,可以對應到前面說過的實驗設計。
當操作變因只有一個且該變因只有兩種可能的時候,
我們就可以用t檢定來判斷差異是否顯著。
組間變異的實驗設計可以用獨立樣本t檢定,
組內變異的實驗設計則是可用成對樣本t檢定。

t檢定也有他對應的假設前提,
有興趣多了解更多細節的人,可以參考以下的文章:

  1. 獨立樣本t檢定
  2. 成對樣本t檢定

再次強調t檢定也是只能在依變數是連續變數的情況使用,
所以像李克特量表,通常會推薦使用無母數分析,
而最常見與t檢定對應的方法就是威爾卡森符號檢定(Wilcoxon Signed-Rank Test),
有興趣的人可以參考這篇的介紹喔:
無母數統計—威爾卡森符號檢定

這篇介紹了t檢定,下篇就要講講ANOVA啦!

不過話說回來我這系列的文章,
目前為止還沒出現太多與軟體開發直接相關的文章,
因為這系列的文章是希望把這些在科技裡面與人相關的各種方法跟視角,
用軟體工程師、甚至是普羅大眾可以理解的角度來寫,
就希望大家不會太介意分類啦:P


上一篇
人機互動之推論統計簡介(2):虛無假設與對立假設以及Z檢定
下一篇
人機互動之推論統計簡介(4):ANOVA與F分配和F檢定
系列文
在AI的時代追求人性30
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言